Inciso 3A

Column

Estadísticas descriptivas

Resumen de Datos

Rango Intercuartil

Rango Total

Estadísticas de Forma

Column

Interpretación estadísticas descriptivas

AvgSessionLength (Duración promedio de la sesión) La duración de las sesiones de los usuarios tiene una media y mediana de 33.1 minutos, con una desviación estándar de 0.99, lo que indica que las sesiones son relativamente homogéneas. El valor mínimo registrado es de 29.5 minutos y el máximo de 36.1 minutos, con un rango total de 6.61 minutos y un rango intercuartílico (IQR) de 1.37 minutos, lo que muestra baja dispersión en los datos. La asimetría de -0.0321 sugiere que la distribución es prácticamente simétrica, sin una inclinación significativa hacia valores altos o bajos. La curtosis de 3.00 indica que la forma de la distribución es muy similar a una normal, con una dispersión de datos dentro de los rangos esperados.

Time on App (Tiempo en la aplicación) El tiempo que los usuarios pasan en la aplicación tiene una media de 12.1 minutos y una mediana de 12.0 minutos, con una desviación estándar de 0.99, lo que indica que la variabilidad en el tiempo de uso es baja. El valor mínimo registrado es de 8.51 minutos y el máximo de 15.1 minutos, con un rango total de 6.62 minutos y un rango intercuartílico (IQR) de 1.37 minutos, mostrando que la mayoría de los usuarios tienen tiempos de uso muy similares. La asimetría de -0.0889 sugiere una ligera inclinación hacia valores más bajos, aunque no de manera significativa. La curtosis de 3.11 indica que la distribución es ligeramente más concentrada en la media en comparación con una distribución normal, lo que implica que los tiempos de uso están menos dispersos.

Time on Website (Tiempo en el sitio web) El tiempo de navegación en el sitio web tiene una media y mediana de 37.1 minutos, con una desviación estándar de 1.01, lo que sugiere que los usuarios pasan un tiempo relativamente estable en la plataforma. El tiempo mínimo registrado es de 33.9 minutos y el máximo de 40.0 minutos, con un rango total de 6.09 minutos y un rango intercuartílico (IQR) de 1.37 minutos, lo que indica que el 50% de los usuarios pasan entre 36.3 y 37.7 minutos en la web. La asimetría de 0.0121 muestra que la distribución es prácticamente simétrica, sin sesgos hacia valores altos o bajos. La curtosis de 2.89 indica que la distribución es ligeramente más plana que una normal, sugiriendo una menor concentración de valores en la media y una dispersión algo mayor.

Length of Membership (Duración de la membresía) El tiempo que los clientes han sido miembros de la plataforma tiene una media de 3.53 años y una mediana de 3.53 años, con una desviación estándar de 0.99, lo que indica que la mayoría de los clientes tienen tiempos de membresía similares. El valor mínimo registrado es de 0.27 años y el máximo de 6.92 años, con un rango total de 6.65 años y un rango intercuartílico (IQR) de 1.20 años, lo que significa que el 50% de los clientes tienen entre 2.93 y 4.13 años de membresía. La asimetría de -0.106 sugiere una leve inclinación hacia clientes con más años en la plataforma, mientras que la curtosis de 3.33 indica una ligera mayor concentración en la media, con pocos valores extremos.

Yearly Amount Spent (Cantidad anual gastada) El gasto anual de los clientes presenta una media de 499.3 dólares y una mediana de 499.0 dólares, con una desviación estándar de 79.3, lo que indica una mayor variabilidad en comparación con las otras variables. El gasto mínimo registrado es de 257.0 dólares y el máximo de 766.0 dólares, con un rango total de 508.8 dólares y un rango intercuartílico (IQR) de 104.3 dólares, mostrando que el 50% de los clientes gastan entre 445.0 y 549.0 dólares al año. La asimetría de 0.0347 indica que la distribución es casi perfectamente simétrica, mientras que la curtosis de 3.45 sugiere la presencia de algunos valores extremos, lo que podría representar clientes con patrones de gasto significativamente más altos que el promedio.

Inciso 4

Column

Gráficos univariados

Gráficos bivariados con “Yearly Amount Spent”

Column

Interpretación gráficos univariados

AvgSessionLength (Minutos promedio de la sesión de asesoría): El atributo tiene una distribución aparentemente simétrica con un ligero peak central, lo que indicaría que posiblemente tenga una distribución cercana a la norma. En cuanto a los valores están aproximadamente entre 30 y 36 minutos, lo que demuestra que existe poca variabilidad de los datos, la mayoría de los clientes tienen sesiones de entre 33 y 34 minutos de asesoría, lo que muestra que este proceso al parecer está estandarizado.

TimeOnApp (Minutos totales en la app): En este caso se ve una distribución simétrica, posiblemente con una distribución normal, con valores entre 8 y 15 minutos aproximadamente. Se observa que los usuarios de la app pasan en promedio entre 11 y 13 minutos en la aplicación. El rango de los datos en este caso es pequeño, lo que indica que el tiempo en la app es consistente entre los clientes, sin mayor variación.

TimeOnWebsite (Minutos totales en el sitio web): La distribución al igaul que los atributos anteriores es simétrica, posiblemente normal, con un ligero sesgo positivo (cola derecha más larga). Los minutos totales en el sitio web van entre los 34 y 40 minutos, destacando que la mayoría de los usuariospasan entre 36 y 38 minutos en la web. Se aprecia una mayor dispersión en comparación con el tiempo en la app, lo que podría indicar que algunos usuarios exploran más el sitio web que otros, podria deberse a que la app es complementaria y funciona más como consulta, mientras que la web está enfocada en un uso más intensivo con posiblemnete más opciones, pero es solo una suposición.

LengthOfMembership (Años de membresía en la tienda): Se puede apreciar una distribución simétrica con una ligera concentración central, en la que el rango de años de membresía en la tienda es de 0 a 6 años con una mayoría clara de clientes con una antiguedad de 3 a 4 años como miembros. Esto podria sugerir una alta retensión después de los primeros años de membresía.

YearlyAmountSpent (Monto anual de compras en dólares): En cuanto a la distribución es simétrica, posiblemente normal, con un rango de valores entre 300 y 800 dólares. La mayoría de los clientes gastan entre 400 y 600 dólares al año en compras, no se ve una diferenciación entre la app y la web pero habría sido interesante analizarlo. Se aprecia una variabilidad moderada, lo que sugiere diferencias en los hábitos de consumo entre clientes.

Interpretación gráficos bivariados

AvgSessionLength vs Yearly Amount Spent (Gráfico Azul): Existe una leve correlación positiva, aunque no muy fuerte, entre la longitud promedio de la sesión y el monto anual de compras. Se parecia dispersión en los datos, lo que sugiere que otros factores además de la duración promedio de la sesión pueden estar influyendo en los gastos anuales. Es grafico sugiere que los clientes que pasan más tiempo promedio en sesiones no necesariamente gastan significativamente más al año.

TimeOnApp vs Yearly Amount Spent (Gráfico Rojo): Existe una correlación moderadamente fuerte y positiva entre el tiempo total en la app y el monto anual de compras. Se aprecia un patrón ascendente más claro en comparación con las otras variables, esto sugiere que a medida que los clientes pasan más tiempo en la app, tienden a gastar más al año, el tiempo en la app parece ser un factor importante que afecta el gasto anual, esto podría ser una oportunidad para optimizar la experiencia en la app y fomentar más interacción para incrementar las compras.

TimeOnWebsite vs Yearly Amount Spent (Gráfico Verde): No se observa una correlación clara entre el tiempo total en el sitio web y el monto anual de compras. Los puntos están dispersos y no muestran un patrón evidente, po lo que sugiere que el tiempo en el sitio web no influye significativamente en el gasto anual de los clientes. Una posible mejora de la efectividad del sitio web (como su diseño o facilidad para realizar compras) podría ser una oportunidad, ya que el tiempo en el sitio web no parece ser un factor determinante para las compras.

LengthOfMembership vs Yearly Amount Spent (Gráfico Morado): Existe una relación positiva clara entre los años de membresía y el monto anual de compras, los clientes con más años de membresía tienden a gastar más, como lo muestra la tendencia ascendente de los datos, la relación es fuerte y consistente, lo que indica lealtad de los clientes a largo plazo, por lo tanto, los clientes más antiguos son los que más gastan. Esto resalta la importancia de estrategias de retención, como recompensas para miembros antiguos o incentivos para que los nuevos clientes permanezcan más tiempo.

Inciso 5

Column

Gráfico de “AvgSessionGroup”

Descripción de “AvgSessionGroup”

Column

Interpretación estadísticas descriptivas y gráfico de “AvgSessionGroup”

Inciso 6

Column

Boxplot de la variable “Yearly Amount Spentr” por categoría

Column

Interpretación del Boxplot de la variable “Yearly Amount Spentr”

Inciso 7

Column

Matriz de las correlaciones

Gráficos bivariados con “Yearly Amount Spent”

Column

Columna Interpretación

Inciso 7B

Column

Matriz de las correlaciones

Heatmap de correlación

Inciso 7C

Column

Matriz de las correlaciones

Gráficos bivariados con “Yearly Amount Spent”

Column

Columna Interpretación

Inciso 8

Column

summary(modelo) - R2.train & R2.valid


Call:
lm(formula = YearlyAmountSpent ~ AvgSessionLength + TimeonApp + 
    TimeonWebsite + LengthofMembership, data = aux1, subset = train)

Residuals:
     Min       1Q   Median       3Q      Max 
-30.2617  -6.3368  -0.3456   6.8310  30.1189 

Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
(Intercept)        -1044.0993    24.9478 -41.851   <2e-16 ***
AvgSessionLength      25.5468     0.4951  51.595   <2e-16 ***
TimeonApp             38.9498     0.5073  76.775   <2e-16 ***
TimeonWebsite          0.3445     0.4871   0.707     0.48    
LengthofMembership    61.3558     0.5000 122.719   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 9.922 on 395 degrees of freedom
Multiple R-squared:  0.9839,    Adjusted R-squared:  0.9837 
F-statistic:  6034 on 4 and 395 DF,  p-value: < 2.2e-16
[1] 0.9838982
[1] 0.9851772

Column

Ajuste en ambas muestras